package sparkml_study

import org.apache.spark.sql.SparkSession

object read_image {
  def main(args: Array[String]): Unit = {
    val spark=SparkSession.builder()
      .master("local[*]")
      .appName("读取图形数据")
      .getOrCreate()
/*
    加载图片而来的dataframe有一个StructType列"image",其包含以图像模式存储的图像数据
 */
    val image_data=spark.read.format("image")
      .option("dropinvalid",true)
      .load("hdfs://192.168.40.110:9000/spark_test_data/mllib/images/origin/kittens")


    //  输出image列的origin,width,height属性值
    image_data.select("image.origin","image.width","image.height").show(false)



    spark.close()
  }

}
